JSAI2026 VQ-VAEとUNMT による創発言語と自然言語の翻訳 - daiiz

JSAI2026 VQ-VAEとUNMT による創発言語と自然言語の翻訳

（予習）

テーマ

マルチエージェント強化学習で生じる「創発言語」を、人間が読める自然言語に翻訳する研究

エージェントの学習方策には介入せず、外部翻訳器として解釈可能性を付与する

背景課題

エージェント同士はタスクに最適化された独自の通信表現を獲得する

人間には解釈しにくく、人間・LLM・強化学習エージェントの協調を難しくする

提案

創発言語を直接自然言語に寄せるのではなく、学習済みエージェントの通信を後段で翻訳

VQ-VAEで連続ベクトルの創発言語を離散トークン列に変換

UNMTで、創発言語トークン列と自然言語メッセージの間の翻訳モデルを学習

対訳データを使わず、創発言語側・自然言語側それぞれの単言語コーパスから翻訳を構築

要チェック daiiz.icon

VQ-VAEによる離散化が、どの程度「意味のあるトークン化」になっているか

UNMTが本当に創発言語の意味を翻訳しているのか、それとも自然言語らしい文を当てているだけか

気になる daiiz.icon

離散化する目的

語彙数を有限にするため

離散化しないと実数ベクトル（埋め込み）を扱わないといけない。これには無限の語彙が必要になる。

創発言語を離散トークン列に変換する点は、Semantic ID / SID の観点からも興味深い

VQ-VAEで得られたコード列が、タスク上の状態や意図とどの程度対応しているのか

離散表現を、翻訳だけでなく検索・分類・可視化に使える可能性

自然言語に翻訳することで、創発言語本来の情報はどれほど丸められるか